凌波微课|扩增子研究第四讲:微生物群落研究策略
The following article is from 凌波微课 Author Young
微生物群落研究策略
微生物群落研究之前,有几个问题需要先弄清楚。由于二代测序技术读长的限制,最多只能得到16S rRNA两个可变区的序列,因此通常在研究之前需要选择到底测哪个可变区?测序平台那么多,我应该选择哪个合适?测序数据量要测多少?生物学重复到底该设置几个?这些问题的答案就在今天的凌波微课。
本期凌波微课主要包括三个方面的内容,首先是扩增子研究区域选择问题;第二,扩增子研究具体分析项目;第三,扩增子研究中的常见问题。
上一期我们也讲到过,目前,关于微生物群落研究方法主要有多样性扩增子研究、宏组学包括宏基因组、宏转录组、宏蛋白组、宏代谢组研究等。1991年Pace首次提出环境基因组学的概念,基于核糖体rRNA基因的扩增子测序来反映系统中的微生物多样性的组成(16S、18S、ITS、功能基因等)。常见Marker gene包括细菌16S rRNA,真菌ITS和18S,功能基因包括AOA、AOB、nirK、nifH、McrA等。通过多样性扩增子研究,获得环境中微生物群落组成结构以及功能。
扩增子研究中我们会思考这样的问题:什么样方法能把我样本中的微生物尽可能的测全?什么样的引物适合我的样本研究?9个高变区,V1-V9该选谁?师兄做的V1-V2区,我做的V3-V4区,数据能不能一起分析?什么方法能把我样本中的微生物尽可能测全?能否鉴定到种吗?带着这些问题,我们来看下面的内容。
16s rRNA基因的序列有10个保守区和9个高变区(v1-v9:长度分布范围约30~100bp)。16s rRNA基因可变区考虑因素:a.测序平台的测序读长;b.与sanger测序结果是否具有较强的一致性;c.可变区域对物种分类比对时体现的准确性。
既往研究中,受限于NGS的读长,PE300模式下,也仅能获得600bp以内的片段读取,而16s rRNA全长约1500+bp,因此基于NGS测序只能对其中的个别高变区域开展。细菌16S测序区域的选择中使用最多的是V4区、V3-V4区和V4-V5区,也有少数研究使用V1-V2区的。整体上来说不同可变区最终得到的结果并不会有本质上的差别。不同可变区最终得到的结果在单一物种的注释和丰度上可能会存在极微小的差别,这个差别几乎可以忽略,不会出现使用一个可变区得到某一物种丰度在不同样本中存在差异,而使用另一个可变区测序却没有差异的情况。
V4(长度:106bp)被认为是一种较为可靠的细菌多样性引物对。16S rRNA的V4区被广泛运用于多种类型样本的细菌多样性调查; V3-V4 (长度:464bp) 适用于illumina PE300 ,该平台可完整覆盖该区域,对细菌的覆盖度最高,数据库信息全,细菌多样性分析注释全面;
V4-V5 (长度:~303bp) 适用于illumina PE250 ,基因组异质性最小; V1-V3 (长度:525bp) 适用于454平台,V7-V9 (长度~300bp) 适用于illumina PE250,与Sanger测序结果最接近;
V3 (长度:~200bp) 适用于illumina PE150,结果与16S rRNA基因全长结果接近;
V4-V6 (长度:~540bp) 适用于454平台,结果与16S rRNA基因全长结果接近。
功能微生物是在自然界中由于其功能的重要性而受到广泛关注的一类微生物,如硝化细菌、反硝化菌、氨氧化细菌、硫酸盐还原菌、固氮菌等。每种功能微生物在分类学上可能有很大不同,但却具有相类似的基因使其能够发挥同样的功能,因此使这些功能细菌发挥这种特定功能的基因就称为功能基因,如 nxrA、nirS/nirK、amoA、dsrB、nifH。功能基因测序可有效研究特定环境中的功能微生物物种信息。
对于初入门的研究者而言,另一个经常迷惑的问题就是测序平台,目前市场上针对16S rRNA扩增子测序所使用的二代测序平台主要有三种,都是Illumina公司生产的,分别是MiSeq、HiSeq和NovaSeq平台。目前这3个平台都可以满足两个可变区的16S rRNA扩增子的读长要求,Illumina对MiSeq的定位是聚焦通量(Focused power):快速简约,适合靶向和小型基因组测序;而HiSeq 2500是生产通量(Production power):强大高效,适合大规模基因组学。此外,NovaSeq通量更高,成本更低,是后续测序的首选。
伴随着三代测序技术的发展,16S rRNA全长测序被看作是克服V区(单个和多个)测序物种鉴定局限性的灵丹妙药。三代测序的长读长可以轻而易举地覆盖16s rRNA的9个高变区域,获得的序列更长,信息量也更多!16s rRNA全长测序因此成为多样性研究的新热点技术,最显著的优势就是由于其含涵盖了全部高变区的信息,可以使物种的分辨率更高,实现众多研究者“种水平”分辨率的要求。我们在之前的微课中有专门介绍过16s全长扩增子测序的优势,这里就不一一赘述了,感兴趣的亲们可以通过我们以前的课程(凌波微课|微生物组多样性研究新热门——16s rRDNA全长扩增子测序)了解16s全长扩增子测序的更多优势。
Uncultured:指该物种不可培养,不知道其具体分类学信息;
Norank:指序列与数据比对上,但数据库也没有具体分类学信息;
Unclassified:指序列与数据比对上,有分类学信息,但不同研究结论不同;
Incertae_Sedis:暂定物种名,如Deltaproteobacteria_Incertae_Sedis,暂定为δ-变形菌纲;
扩展阅读
高通量测序基础知识 微生物群落数据分析教程 抗生素抗性基因相关 宏组学研究之“道” 转录组测序技术和结果解读 红皇后学术文献解读列表 基本分子生物学实验 PAST:最简便易用的统计学分析软件教程目录 每天学习一点R系列 微生物研究相关工具 微生物研究投稿期刊简介